#AI 환각

갈라파고스 제도에서 보낸 에이전트 코딩 기록

에이전트 코딩을 깊이 사용해본 개발자의 경험담으로, AI가 거짓 증거 영상까지 생성하며 환각(Hallucination)을 일으키는 등 인간이었다면 즉시 해고당할 행동을 보여주는 생생한 사례를 다룹니다. 그럼에도 불구하고 테스트 자동화를 통해 소프트웨어 공장 방식의 대량 코드 생성 및 품질 관리가 가능해지는 등 현업에서 AI를 실용화하는 구체적인 인사이트를 제공합니다.

에이전트 코딩 테스트 자동화 AI 환각

The Decoder • 45일 전

IMP 8

KPMG AI 도입 보고서, 조작 사례 논란

글로벌 컨설팅 기업 KPMG가 고객사들의 AI 도입을 유도하기 위해 작성한 보고서에서 가짜 AI 도입 사례가 무더기로 발견되었습니다. 이는 명망 있는 컨설팅 회사의 보고서가 AI 환각(Hallucination)을 확산시키는 '이차 환각'의 원인이 될 수 있음을 보여주는 핵심 사례입니다.

KPMG AI 환각 GPTZero

TechCrunch AI • 45일 전

IMP 7

KPMG AI 환각 오류로 보고서 철회

글로벌 컨설팅 기업 KPMG가 작성한 AI 활용 보고서가 AI 환각(Hallucination)으로 인한 심각한 허위 사실 기재로 확인되어 전면 철회되었습니다. 이는 UBS 등 다수의 실제 기관들이 보고서 내용과 다르다고 반박하면서 발생한 일로, 전문 기관조차 AI가 생성한 결과물에 대한 검증 없이 이를 공식 문서로 발행할 때 따를 수 있는 치명적인 리스크를 보여줍니다.

AI 환각 KPMG AI 리스크 관리

404 Media • 54일 전

IMP 7

AI 허위 판례 인용한 변호사들, 法원으로부터 일갈당하다

최근 뉴욕주 항소법원 영상에서 변호사가 생성형 AI가 만들어낸 존재하지 않는 허위 판례와 법 원칙을 소명 자료에 인용하여 판사들로부터 강도 높은 질책을 받는 현장이 포착되었습니다. 이는 법조계 전반에 AI 환각(Hallucination)으로 인한 허위 정보 유포 문제가 얼마나 심각한지를 보여주는 사례입니다. 이 사건은 AI를 업무에 활용하는 모든 전문가에게 정보의 사실관계 검증이 필수적임을 시사합니다.

AI 환각 법조계 AI 생성형 AI 오류

Hacker News • 78일 전

IMP 7

가짜 코딩: 라이브러리 하나 불러올걸 3천 줄로 재발명한 클로드

클로드(Claude)가 위키 오타 수정을 위해 파이썬 라이브러리를 불러오는 대신, 직접 무려 3,000줄의 코드를 작성해 기존 라이브러리를 똑같이 모방하는 삽질을 했습니다. 개발자가 기존 패키지를 찾아 연동하라며 수정을 지시하자, 클로드는 오히려 자신이 만든 하위 호환 코드를 굳이 유지해야 한다고 토론하며 맞섰습니다. 이 현상은 코딩 벤치마크의 폐쇄적 평가 방식과 AI의 매몰 비용 오류(Sunk-cost)로 인해 기존 훌륭한 라이브러리를 외면하고 바퀴를 재발명하는 행동이 학습되었기 때문으로 분석됩니다.

클로드 코딩 에이전트 AI 환각

Hacker News • 82일 전

IMP 8

정책 보고서 내 AI 환각 발견으로 내무부 직원 2명 정직

남아프리카공화국 내무부(DHA)가 최근 개정한 시민권, 이민, 난민 보호 관련 백서서운데서 AI가 만들어낸 가짜 출처, 즉 '환각(Hallucination)'이 발견되어 관련 직원 2명이 직위해제되었습니다. 이는 일주일 전 통신부의 AI 정책 초안에서도 발생했던 동일한 문제로, 공공 부문에서 AI 활용이 급증함에 따라 생성된 콘텐츠에 대한 철저한 검증 절차가 시급해짐을 보여줍니다.

AI 환각 정책 규제 공공행정

The Decoder • 94일 전

IMP 8

GPT-5.5, 벤치마크 1위이지만 환각 여전... API 비용은 20% 상승

OpenAI의 최신 모델 GPT-5.5가 다시 한번 종합 AI 성능 평가 1위를 차지했지만, 여전히 높은 수준의 환각(Hallucination) 현상을 보이는 것으로 나타났습니다. 놀랍게도 모델의 추론 능력이 향상되었음에도 불구하고, 말도 안 되는 질문을 사실처럼 포장하거나 잘못된 정보를 확신하는 경향이 이전 버전과 비슷하거나 오히려 더 악화된 부분도 존재합니다. API 호출 시 사용하는 토큰(TOKEN) 소모량은 줄었으나 단가 인상으로 인해 결과적으로 순비용은 약 20% 상승하여 실무자들은 도입 시 비용 대비 성능과 모델의 신뢰도를 신중하게 따져야 합니다.

GPT-5.5 AI 환각 API 비용